Home

Home

7.6.3 평가용 골든 데이터셋(Evaluation Golden Dataset) 구축 및 벤치마킹

Home / 소프트웨어 공학 (Software Engineering) / 제목: 오라클: AI 주도 개발을 위한 해답 / Chapter 7. LLM-as-a-Judge: 평가용 AI 모델을 활용한 하이브리드 오라클 시스템 / 7.6 Meta-Evaluation: 오라클 자체의 신뢰성 검증 / 7.6.3 평가용 골든 데이터셋(Evaluation Golden Dataset) 구축 및 벤치마킹

7.6.3 평가용 골든 데이터셋(Evaluation Golden Dataset) 구축 및 벤치마킹

Generated by Rust Site Gen